A evasão escolar é um problema institucional que representa o fim do vínculo acadêmico estudantil e suas causas partem de várias vertentes, podendo ser geradas pelo próprio aluno ou a pela instituição na qual está cursando. Deste modo, o problema da identificação de alunos em risco de evasão se torna algo totalmente subjetivo, necessitando de metodologias e abordagens para que se possa lidar com tal problema. No presente projeto de iniciação científica (IC), no qual constitui o segundo ano de estudo, foi desenvolvido uma metodologia de abordagem de conhecimento denotada de MATEO, onde está foi também a dissertação de conclusão de curso do aluno mestrando Leonardo Torres Marques. A metodologia MATEO foi desenvolvida utilizando a linguagem de programação python, os códigos fontes da metodologia estão disponíveis em um repositório publico no GitHub (https://github.com/AnaliseDeDadosUfersa/AnalisedeDados.git). O caso de uso utilizado para o desenvolvimento da metodologia foi a dos alunos do curso de ciência da computação da universidade federal rural do semiárido (UFERSA). O processo de construção da abordagem de conhecimento se utilizou de técnicas de mineração de dados e classificadores como redes neurais artificiais para a predição de dados de ex alunos do curso de ciência da computação da UFERSA. Os dados foram fornecidos via questionário pelos próprios alunos via Google Forms, o questionário era formado por variáveis relacionadas as características do aluno, as características da instituição e as características externas a instituição, essas variáveis foram definidas na primeira etapa da abordagem sendo está a etapa de definição de variáveis realizada no primeiro ano de projeto de IC. Após a realização da coleta de dados foram realizadas etapas para corrigir e normalizar os dados obtidos, sendo estas as etapas: processamento de dados e normalização de dados, ambas realizadas no primeiro ano de projeto de IC. Com os dados processados e normalizados foram testados vários modelos preditivos para a validação da metodologia, nesta etapa o intuito era encontrar os melhores modelos preditivos, utilizando como critério avaliativo a precisão de acerto dos modelos. As atividades realizadas no projeto de IC do ano vigente é portanto relacionadas a finalização da metodologia, implementação e experimentação dos modelos preditivos e validação dos mesmos. Os modelos criados foram treinados com os dados dos 100 ex alunos do curso de ciência da computação, estes dados foram repartidos respectivamente em dados de treino e teste, constituindo 70% dos dados treino e 30% dos dados teste, os modelos preditivos testados foram: Adaptive Boosting, J48, Naive Bayes, Multilayer Perceptron (MLP), Support Vector Machine (SVM) e k-nearest neighbors algorithm. Os modelos que apresentaram melhor desempenho foram o MLP e SVM ambos com média de acerto de 98% sob os dados de teste. Com resultado dos modelos validados, tendo como porcentagens acerto superior a 95% dos dados testados, conclui-se que a abordagem desenvolvida no projeto IC constitui uma de abordagem satisfatória para a inferência de causas da evasão escola nos mais diversos escopos e instituições.
Comissão Organizadora
Thaiseany de Freitas Rêgo
RUI SALES JUNIOR
Comissão Científica
RICARDO HENRIQUE DE LIMA LEITE
LUCIANA ANGELICA DA SILVA NUNES
FRANCISCO MARLON CARNEIRO FEIJO
Osvaldo Nogueira de Sousa Neto
Patrício de Alencar Silva
Reginaldo Gomes Nobre
Tania Luna Laura
Tamms Maria da Conceição Morais Campos
Trícia Caroline da Silva Santana Ramalho
Kátia Peres Gramacho
Daniela Faria Florencio
Rafael Oliveira Batista
walter martins rodrigues
Aline Lidiane Batista de Amorim
Lidianne Leal Rocha
Thaiseany de Freitas Rêgo
Ana Maria Bezerra Lucas